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摘要 : 【目的 /意义 ] 基 于 用 户 画像 创建 社交 媒体 资源 聚合 模型 ,为 资源 的 聚合 提供 参考 ,丰富 和 拓展 其 理 
论 研究 体系 。[ 方 法“ 过程] 在 深度 剖析 用 户 画 像 的 内 涵 6、 算法 的 基础 上 ,基于 社交 媒体 分 别 构建 用 户 画像 和 资 
源 画 像 的 模型 ,运用 社会 化 标签 系统 方法 ,研究 基于 社交 媒体 的 用 户 画 像 和 资源 画像 之 间 的 映射 关系 。 借 鉴 领 
域 本 体 的 方法 ,通过 对 数据 的 深层 次 挖掘 ,利用 资源 聚合 的 原理 ,构建 基于 资源 画像 的 社交 媒体 内 部 资源 聚合 


模型 和 外 部 资源 聚合 模型 。[ 结果 / 

社交 媒体 的 资源 聚合 提供 新 的 思路 。 
关键 词 : 用 户 和 画像 ”社交 媒体 
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资源 画像 


结论 ] 在 大 数据 时 代 , 基 于 用 户 画 像 和 资源 画像 的 相关 理论 与 方法 ,能 够 为 


随 着 物 联 网 、 云 计算 ,大 数据 人工 智能 领域 时 代 
的 到 来 ,社交 平台 已 经 得 到 了 人 们 的 高 度 依赖 。 在 开 
放 的 环境 下 ,用 户 不 仅 是 资源 的 使 用 者 ,同时 也 是 资源 
的 创造 者 和 资源 的 共享 者 。 随 着 用 户 信息 行为 轨迹 更 
易 捕捉 ,用 户 的 数据 更 易 获取 ,根据 用 户 的 需求 ,为 用 
户 扣 供 精准 、 客 观 \ 动 态 的 服务 变 得 越发 重要 ,已 经 成 
为 蒂 者 们 关注 的 前 沿 和 热点 。 随 着 社交 网 络 的 兴起 ， 
微 情 微 信 豆瓣 等 社区 得 到 了 快速 的 发 展 ,通过 社交 
网 顺 , 用 户 不 仅 可 以 感知 天 下 大 事 , 与 此 同时 还 可 以 足 
不 旭 户 查找 感 兴趣 的 影音 讯息 。 由 于 社交 媒体 用 户 人 
数 逐 年 增多 ,满足 用 户 多 样 化 ,个 性 化 的 服务 将 成 为 人 
们 追求 的 目标 。 鉴 于 此 ,笔者 尝试 在 吸收 和 借鉴 前 人 
经 验 和 结果 的 基础 上 ,对 社交 媒体 的 资源 特征 进行 分 
析 。 通 过 深入 挖 据 用 户 的 行为 数据 ,从 而 进行 社交 媒 
体 的 用 户 画 像 与 资源 画像 的 构建 。 在 整合 用 户 行为 构 
成 要 素 的 基础 上 ,搭建 社交 媒体 的 资源 聚合 模型 ,主要 
分 为 内 部 资源 聚合 模型 和 外 部 资源 聚合 模型 ,为 用 户 
言 息 资 源 聚 合 和 推送 的 研究 与 应 用 提供 一 种 新 的 思路 

尝试 。 本 文 的 逻辑 思路 见 图 1。 


2 文献 回顾 


随 着 人 工 智 能 大 数据 领域 的 悄然 兴起 ,用 户 画 像 


领域 的 研究 才 逐 步 成 为 众多 学 者 关注 的 热点 ,并 取得 
了 一 定 的 研究 成 果 。 杨 帆 " 从 读者 画像 和 资源 画像 着 
手 ,构建 了 图 书馆 的 大 数据 平台 ,为 图 书馆 用 户 提 供 精 
准 的 服务 ; 王 顺 管 ”通过 对 图 书馆 用 户 进行 需求 分 析 ， 
基于 用 户 的 兴趣 爱好 为 他 们 提供 差异 化 的 推荐 服务 ; 
尹 相 权 等 ”通过 对 图 书馆 用 户 的 数据 进行 建 模 分 析 ， 
得 出 了 影响 用 户 行为 的 主要 因素 ;K，Petric 等 中 基于 
自 适应 的 知识 管理 方法 ,开发 了 一 个 网 络 用 户 的 心智 
模型 ,实现 了 对 不 同 的 用 户 群 体 进行 分 类 ; 程 全 5 探讨 
了 基于 用 户 画 像 的 数字 图 书馆 信息 服务 的 基本 模式 ， 
为 数字 图 书馆 信息 的 精准 服务 提供 科学 决策 ; 王 凌 雷 
等 四 从 4 个 方面 (用 户 资历 ,用户 参 与 度 .用户 回 答 质 
量 和 用 户 发 展 趋势 ) 构 建 了 社会 化 问答 社区 用 户 画像 ; 
单 晓 红 等 中 从 用 户 信任 属性 、 酒 店 信息 属 性 和 用 户 评 
价 信息 属性 3 个 方面 构建 了 携程 酒店 用 户 画 像 的 概念 
模型 ; 黄 文 斌 等 从 移动 数据 的 类 型 移动 用 户 行为 模 
式 ,移动 用 户 画像 的 建构 和 移动 用 户 画 像 的 深度 应 用 
等 几 个 方面 构建 了 数据 驱动 的 移动 用 户 行为 的 研究 框 
架 ; 郝 胜 宇 等 ”从 目标 顾客 识别 .目标 顾客 扫描 、 消 费 
异动 和 精准 推送 等 几 方 面 详细 论述 了 用 户 画 像 技 术 ， 
以 及 用 户 画 像 对 企业 精准 营销 的 重要 作用 ; 裴 国 才 
通过 用 户 画 像 的 方法 ,设计 并 实现 了 精准 营销 的 模型 ; 
王 晓 霞 等 ' 利用 大 数据 技术 对 用 户 进 行 精准 聚 类 从 
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图 1 本 文 逻辑 思 


而 刻画 用 户 画像 ; 盛 怡 瑾 "将 用 户 画 像 技 术 应 用 到 学 
术 期 刊 审 稿 人 遂 选 中 ,并 构建 了 审 稿 人 画像 模型 ; 熊 伟 
等 中 通过 采集 用 户 信 息 并 对 用 户 群体 进行 分 类 ,用 
LDR 分 析 网 页 的 具体 内 容 建立 主题 模型 ,提出 了 一 种 
基于 用 户 画像 和 内 容 的 服务 重 定向 方法 ; 张 诗 军 等 
基 玖 用 户 画 像 的 理论 与 技术 提出 了 电力 大 数据 的 客户 
荆 黎 构建 方法 ;高扬 等 "对 智能 制造 领域 的 人 才 画 像 
进行 了 构建 ,揭示 了 该 领域 杰出 人 才 的 显著 特征 。 

里 可 以 看 出 ,目前 用 户 画 像 


计 鹿 机 以 及 市 场 营 销 领域 ,研究 方法 较为 单一 ,多 以 实 
旅 议 究 为 主 。 因 此 ,笔者 尝试 在 吸收 和 借鉴 前 人 研究 
成 梁 的 基础 上 ,基于 社交 媒体 这 一 平台 ,实现 用 户 画像 
各 光源 画像 的 刻画 ,并 建立 二 者 之 间 的 映射 关系 ,着 力 
构 嫩 平台 内 部 的 资源 聚合 模型 ,同时 打造 跨 平台 的 不 
同 福 交 媒体 之 间 的 资源 聚合 模型 ,为 用 户 智能 终端 的 
信息 资源 推送 提供 参考 ,为 该 领域 的 相关 研究 提供 理 
论 支 撑 。 


3 ”用 户 画 像 的 研究 概述 


3.1 用 户 画 像 的 内 酒 

最 早 提出 用 户 画 像 (persona) 的 学 者 是 被 命名 为 
交互 设计 之 父 的 阿兰 ， 库 珀 ,该 学 者 认为 ,用 户 画 像 是 
真实 反映 用 户 数据 特征 的 虚拟 代表 ,通过 对 用 户 数据 
的 挖 据 ,用户 的 目标 ,行为 和 观点 进行 抽取 ,分 析出 用 
户 的 典型 特征 ,把 用 户 的 静态 数据 和 动态 数据 标签 化 ， 
从 而 形成 的 一 个 目标 用 户 的 模型 。 用 户 画 像 的 核心 工 
作 就 是 通过 人 为 规定 高 度 精确 的 特征 标识 来 为 用 户 打 
标签 ,主要 目的 就 是 通过 标签 ,使 计算 机 能 够 程序 化 地 
处 理 一 些 与 人 相关 的 数据 信息 ,提高 信息 获取 的 速率 ， 


户 行为 轨迹 的 更 易 捕捉 ,为 用 户 提供 精确 、 动 态 的 信息 
变 得 越 来 越 重 要 ,用户 画像 的 应 用 范围 也 在 不 断 拓 展 ， 
从 最 传统 的 营销 领域 的 用 户 画 像 (persona) 开始 向 社 
交 媒 体 等 领域 用 户 画 像 (user profiling ) 逐步 延伸 。 
3.2 用户 画像 研究 主题 、 理 论 模 型 

通过 对 用 户 画 像 的 相关 论文 进行 脉络 梳理 可 以 发 
现 , 目 前 用 户 画 像 的 研究 主题 大 致 分 为 以 下 几 种 : 微 
博 '" 、 移 动 图 书馆 … 、 企 业 营 销 、 社 会 化 问答 社区 “ 、 
电子 商务 “医疗 领域 和 金融 行业 等 ;用 户 画 像 的 模 
型 主要 包括 :马尔 可 夫 随 机 场 模型 .逻辑 回归 模型 ;用 
户 画 像 的 理论 主要 包括 :社会 认同 理论 "复杂 适应 
系统 理论 和 博弈 论 等 ;用 户 画 像 的 相关 算法 主要 包括 : 
层次 分 析 法 ”、 聚 类 算法 支持 向 量 机 、 朴 素 贝 叶 其 
分 类 ”| 、 相 关 分 析 法 ,决策 树 分 析 法 、 神 经 网 络 分 析 
法 ”等 ,如 表 1 所 示 : 

表 1 用 户 画 像 相 关 研 究 的 主题 模型 


研究 主题 理论 模型 机 器 学 习 算法 
微 博 、 数 字 图 书馆 、 模型 :马尔 可 夫 随 机 ”层次 分 析 法 、 聚 类 算法 、 支 


社交 媒体 .社会 化 问 ” 场 模型 .逻辑 回归 模 

答 社区 、 网 络 安全 、 型 法 -means 算法 、 神 经 网 

医疗 领域 .金融 行 ”理论 : 社会 认同 理 ” 络 算法 .相关 分 析 法 .决策 

业 .电子 商务 论 .复杂 适应 系统 理 树 分 析 法 、BP 神经 网 络 分 
论 .博弈 论 析 法 


等 向 量 机 朴素 贝 叶 斯 分 类 


3.3 ”用户 标签 体系 

用 户 画 像 的 标签 体系 ,就 是 用 户 信息 的 标签 化 ,在 
构建 用 户 画像 之 前 ,需要 建立 标准 的 标签 体系 ,来 全 方 
位 多 层次 地 反映 出 用 户 画 像 的 基本 内 容 。 用 户 画 像 
标签 的 建立 ,需要 对 数据 进行 采集 和 处 理 , 基 于 数据 的 
不 同 ,以 及 需求 的 不 一 致 ,在 采集 标签 时 ,大 致 采用 两 
种 方法 :中 基于 人 工 手 动 归 纳 并 标注 用 户 的 标签 ;@ 运 
用 机 器 算法 进行 半 人 工 的 方式 提取 。 标 签 指标 体系 的 


Ny 


在 还 原 用 户 信息 的 基础 上 ,构建 用 户 画 像 ,从 而 为 广告 
投放 .市场 营 销 等 领域 的 信息 推广 提供 服务 。 随 着 用 
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完善 程度 ,对 于 用 户 画 像 的 精准 构建 将 起 到 至 关 重 要 
的 作用 。 在 标签 体系 中 ,每 一 个 标签 都 是 某 一 个 用 户 
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徐 海 玲 ， 张海涛 ， 魏 明珠 ,等 .社交 媒体 用 户 画 像 的 构建 及 资源 聚合 模型 研究 [J]. 图 书 情报 工作 ,2019,63(9):109 -115. 


特征 的 具体 体现 ,从 某 种 程度 上 来 说 ,该 标签 要 具有 一 


分 .推送 程度 .评论 时 间 .评论 摘要 .评论 内 容 . 评 论 有 


定 的 群体 性 ,能够 归纳 出 事物 的 某 种 属性 和 基本 的 特 
征 ,标签 在 表现 形式 上 多 种 多 样 , 可 以 是 中 文 的 符号 也 
可 以 是 数字 。 从 原始 数据 的 收集 和 处 理 , 到 业务 标签 
的 生成 ,从 数据 的 清洗 和 整理 ,到 最 终 的 机 器 学 习 , 通 


过 对 用 户 的 属性 特征 进行 分 类 ,都 能 够 运用 计算 机 进 
行 处 理 ” ,如 图 2 所 示 : 
用 户 标签 体系 
SN 
| ”用户 行为 特征 | 户 需 求 偏好 | 


用 户 评 论 量 
用 户 点 赞 量 
用 户 转发 量 
用 户 阅 读 量 


消费 特征 
兴趣 爱好 
社交 信息 


Si 生来 , 百 了 网 产 业 的 民生 人 起, 和 类 弄 风 入 
呈 沁 体 也 如 雨后春笋 般 莲 勃发 展 ， 对 于 社交 媒体 而 言 ， 
准 调 户 提供 精准 .个 性 化 的 推送 服务 做 关 各 大 社交 媒 
仇 阐 长 远 发 展 。 豆 尖 网 是 Web2.0 时 代 最 具 代 表 性 的 
网 站 之 一 ,其 在 线 功 能 较为 丰富 , 豆 汰 网 已 经 由 最 初 的 
挑 供 读 书 电量 彤 和 音乐 信息 的 网 站 ,发 展 成 一 个 集 博 
客 (和 ? 业 为 一 一 体 的 综合 性 的 社交 网 络 平台 ,时 至 今日 ， 
豆 沽 电影 已 经 成 为 中 国 最 大 最 权威 的 影 分 享 和 在 线 
评论 的 电影 社区 ,甚至 被 称 为 华语 圈 的 "IMDB"， 目前 
有 将 近 3 000 多 家 电影 院 加 盟 其 中 , 豆 辩 电影 已 经 成 
为 豆 准 网 络 主 网 站 点 击 流量 的 第 一 子 模块 。 因 此 , 笔 
者 以 豆瓣 电影 网 为 例 ,对 豆瓣 网 的 用 户 画 像 和 资源 画 
像 进 行 构建 ,以 期 通过 画像 之 间 的 映射 关系 ,来 实现 个 
性 化 的 推送 服务 *1。 
4.1 社交 媒体 用 户 画 像 构建 
4.1.1 数据 的 获取 以“ 豆 办 "电影 为 例 , 运 用 八 爪 鱼 
疏 虫 软件 ,对 豆瓣 电影 网 2017 - 2018 年 热门 电影 进行 
了 数据 的 候 取 工作 ,的 取 时 间 为 2018 年 5 月 7 日 ,经 
过 对 数据 的 筛选 .清洗 和 加 工 , 导 出 数据 文件 到 Excel 


中 , 共 疏 取出 电影 数据 221 条 ,用 户 的 评论 数据 为 
7 000 条 。 将 这 些 数据 进行 归 类 汇总 ,对 数据 进行 统 


计 分 析 , 疏 取 的 内 容 主 要 归 类 为 两 大 部 分 : 近 两 年 热门 
电影 的 相关 数据 和 用 户 的 相关 数据 。 用 户 数据 主要 包 
括 作品 名 称 \ 作 品 蔬 .评论 标题 .评论 者 的 中 \、 星 级 评 


数 .评论 无 用 数 、 追 评 时 间 、 追 评 内 容 等 。 资 源 数据 
ey 区 片 名 .电影 导演 .电影 编剧 .电影 主演 、. 电 


| 


类 型 电影 制 片 国家 、 上 映 日 期 \ 电 影评 分 .电影 评论 
人 数 。 
4.1.2 用 户 画像 标签 体系 的 建立 ”笔者 基于 用 户 数 


据 ,对 用 户 的 标签 体系 进行 了 划分 ,主要 分 为 :用 户 的 
自然 属性 、 用 户 的 行为 特征 属性 和 用 户 的 需求 属性 3 
个 方面 。 用 户 的 自然 属性 主要 包括 用 户 的 耳 用户 所 
在 城市 ;用 户 的 行为 属性 主要 包括 用 户 评分 .用 户 推 
厦 ,用户 评论 和 用 户 分 享 ;用 户 的 需求 属性 主要 包括 影 
片 演员 影片 导演 .影片 类 型 .影片 上 映 档 期 .影片 语 


种 .评论 得 分 和 影片 排行 榜 等 ,如 图 3 所 示 : 
Po 影 上 演员 
户 住址 EA 影片 主演 
影片 类 型 
户 评分 户 画像 标签 体系 需求 偏好 | 上 映 档期 
户 评 cea 下 影片 语 
评论 行为 特征 影片 语种 
户 推荐 评论 内 容 
户 分 享 影片 排行 
图 3 豆 办 电影 用 户 画 像 的 标签 体系 
4.1.3 画像 的 构建 ”为 了 能 够 更 直观 地 显示 用 


户 的 标签 体系 ,笔者 将 易 词 云 软件 应 用 于 用 户 画 像 的 
构建 中 ,用 户 的 标签 主要 以 用 户 的 行为 特征 和 需求 特 
征 为 研究 的 核心 ,在 词 云 中 ,字体 越 大 ,代表 该 类 用 户 
的 标签 处 于 核心 地 位 ,并 且 在 用 户 的 标签 体系 中 占有 
着 决定 性 的 地 位 ,相反 ,字体 越 小 ,代表 该 类 用 户 的 标 
签 处 于 非 核心 地 位 ,作用 相对 较 弱 。 笔 者 以 豆瓣 网 的 
用 户 群 体 为 例 ,构建 的 用 户 画 像 如 图 4 所 示 : 


图 4 豆 办 电影 用 户 画 像 词 云图 


4.2 社交 媒体 资源 画像 构建 

4.2.1 画像 标签 体系 的 建立 ”资源 画像 的 标签 
体系 大 致 分 为 3 个 层级 ,分别 是 影片 的 自然 属性 、 影 
的 特征 属性 和 影片 的 内 容 属性 ,影片 的 自然 属性 主要 
包括 影片 的 片 名 、 影 片 的 上 映 年 份 . 影 片 的 导演 ; 影 
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的 特征 属性 主要 包括 影片 的 评价 得 分 .影片 的 评价 人 
数 . 影 片 的 影评 .影片 的 媒体 宣传 .影片 的 话题 宣传 和 
影片 的 路 演 宣 传 ;在 影片 的 内 容 分 类 里 ,大 致 分 为 两 大 
部 分 ,分 别 为 影片 对 人 的 需求 标签 体系 ,以 及 影片 本 身 
的 内 容 标签 体系 。 影 片 对 人 的 需求 标签 , 主要 包括 影 
片 的 价格 .影院 的 环境 .影片 的 类 型 .影片 的 语种 ; 影 

内 容 标签 主要 包括 影讯 .影片 购 票 .影片 排行 榜 .影片 分 
类 ,影评 ,影片 年 度 榜 单 和 观 影 报 告 等 ” 。 如 表 2 所 示 : 


的 ,分 别 为 用 户 资源 和 标签 ,它们 三 个 之 间 形 成 了 一 
个 完整 的 大 众 分 类 法 (folksonomy) 。 在 该 系统 中 ,每 一 
组 数据 之 间 都 遵循 着 F = | 用户、 资源 ,标签 1 ,标签 2 ， 
a 标签 t) ,F = | user,item ,tagl] ,tag2……tagt| ,其 中 ， 
t 是 由 用 户 分 配给 不 同 资源 的 标签 的 数量 。 

定义 M= |M,M,,M,,M,,…: MI .V= |V,,V,, 
Vs, Vy, ee VI T= |T,,T,,T,,T,, T,| ,其 中 ， 
MV 和 T 分 别 代表 三 个 不 同 的 数据 集 ,M 代表 用 户 


表 2， 豆 辩 电影 资源 画像 标签 体系 集 V 代表 资源 集 T 代表 标签 集 。ij. 分 别 代表 各 自 
项 目 内 容 对 应 数据 集 的 数量 。 

ee 影片 的 片 各 同时 ,每 一 组 的 关系 有 相应 的 矩阵 构成 ,具体 有 
届 性 EM B,B',B", 分 别 代表 着 用 户 与 资源 资源 与 标签 以 及 用 

TS 户 与 标签 。 在 矩阵 B 中 ,如 果 ML 选择 了 资源 了, 则 b。 

bp 人 =1 ,否则 py =0。 同 理 可 得 ,在 B' 甜 阵 中 ,如 果 Vi 被 
-和 影片 的 影评 标记 了 人 T,, 那 么 by =1 ,否则 by =0。 在 了 "矩阵 中 ,如 果 
< 影片 的 媒体 宣传 .影片 的 话题 宣传 和 影片 的 路 演 宣 传 M,; 选择 了 Vj, 则 b; =1, 否 则 by =0。 

加 人 的 需求 标签 影片 的 价格 笔者 借鉴 社会 化 标签 系统 的 模型 ,将 该 模型 中 M 
SS pe 代表 用 户 画 像 ,V 表示 资源 画像 ,对 用 户 画 像 和 资源 画 
~ 影片 的 语种 像 二 者 之 间 建 立 T 的 标签 集合 ,从 而 建立 了 用 户 画 像 
i ee 与 资源 画像 之 间 的 映射 关系 ,如 图 6 所 示 : 

影片 年 度 榜 间 

三 > 行为 特征 和 

412E 资源 画像 的 构建 ”运用 易 词 云 软件 ,基于 资源 

画 懂 的 标签 体系 ,对 资源 画像 进行 了 构建 ,由 于 资源 画 和 


像 的 标签 体系 较为 复杂 ,所 以 剔除 了 资源 标签 中 重复 
的 肚 值 ,并 将 资源 的 标签 单词 数值 设置 为 1 ,生成 数据 
格式 ,并 将 单词 的 间隔 设置 为 0, 使 生成 数据 的 单词 间 
隔 间 隙 较 适 中 ,构建 的 资源 画像 如 图 5 所 示 : 


演员 


影评 牌 


5 豆 准 电影 资源 画像 词 云图 


4.3 用 户 画 像 与 资源 画像 之 间 的 映射 关系 
社会 化 标签 系统 是 由 3 种 不 同类 型 的 集合 构成 
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图 6 用 户 画 像 与 资源 画像 之 间 的 映射 关系 


在 该 映射 关系 中 ,通过 在 用 户 画 像 与 资源 画像 之 
间 建 立 标签 ,使 它们 之 间 的 映射 关系 得 以 成 立 。 其 中 ， 
M = | 用 户 的 自然 属性 ,用 户 的 行为 属性 ,用 户 的 需求 
属性 | V = | 影片 的 自然 属性 , 影 


的 特征 属性 , 影 
的 内 容 属 性 | T = !{ 行 为、 需求 ,特征 内 容 | 。 利 用 聚 


类 算法 将 标准 标签 作为 聚 类 的 中 心 , 计 算 用 户 画 像 和 
资源 画像 的 自 定义 标签 与 聚 类 中 心 标签 的 相关 度 ,将 
自 定义 标签 聚集 到 相关 度 最 大 的 聚 类 中 心 的 所 属 类 
中 。 直 到 剩余 的 自 定义 标签 与 聚 类 中 心 的 相关 度 均 小 
于 效 值 ,停止 聚 类 ,将 剩 下 的 自 定义 标签 互相 聚 类 ,将 
新 的 聚 类 中 心 存 人 到 标准 的 标签 库 中 ,重新 计算 自 定 
义 标签 与 标准 标签 的 相似 度 , 并 调整 自 定义 标签 的 聚 
类 ,得 到 新 的 标签 的 标准 聚 类 。 通 过 该 种 方法 实现 用 
户 画 像 与 资源 画像 之 间 的 映射 ””。 笔 者 以 豆 辩 电影 
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网 站 为 例 , 将 豆 为 电影 网 站 中 的 用 户 画像 和 资源 画像 
的 属性 进行 具体 细 分 ,并 建立 标签 ,形成 了 具体 的 用 户 
画像 映射 模型 ,如 图 7 所 示 : 


说 


| 影响 演员 一 一 一 演员 一 一 一 > 影响 主演 … | 


EN 


影片 类 型 一 ，， 类 型 一 一 一 惊悚， 言 剧 … 


营 国 薪 沙 


影片 语种 一》 语种 一 英语、 汉语 … 


影片 排名 一 一 排名 一 一 一 影响 指 行 榜 … 


、| 影片 评价 一 一 一 评论 一 一 一》 评价 得 分 … | 一 


图 7 ”用户 画 像 与 资源 画像 的 映射 模型 


_ 在 该 模型 中 ,依据 用 户 评论 .点 赞 等 信息 ,帮助 用 
户 春 找 感 兴趣 的 电影 资源 。 通 过 将 电影 的 关键 词汇 和 
交 肚 存储 在 标签 体系 中 ,依据 用 户 的 检索 信息 ,在 标签 
樟 遇 进行 词汇 的 高 级 匹配 ,使 资源 画像 的 检索 内 容 与 
权 壳 关键 词 相对 应 ,为 用 户 实现 推送 服务 ,这 种 方式 在 
菜 和 程度 上 ,不 仅 满足 了 用 户 个 性 化 的 需要 ,而 且 提 训 
JG 扩 送 的 服务 质量 。 例 如 :用 户 在 标签 中 输入 排名 ,这 
蛙 险 索 系 统 会 根据 用 户 的 检索 需求 ,在 资源 画像 中 会 
车 网 影片 的 年 度 榜 单 和 影片 的 排行 榜 等 信息 ,从 而 能 
鲍 光 用 户 提供 精准 的 推送 。 

“社交 媒体 的 资源 聚合 模型 构建 

5. 全 模型 的 构成 要 素 

.一 资源 聚合 是 指 对 互联 网 上 多 种 资源 的 特征 信息 或 
者 大 同类 型 的 数据 信息 进行 搜集 和 筛选 .分 析 和 整理 ， 
通过 对 资源 的 数据 挖掘 来 分 析 资源 之 间 的 潜在 关系 ， 
根据 资源 之 间 的 属性 关系 实现 资源 的 聚集 ,从 而 为 用 
户 提供 知识 资源 与 信息 的 过 程 。 
5.1.1 用 户 画像 与 资源 画像 ”用 户 是 社交 媒体 资源 
聚合 和 服务 推送 的 主体 ,是 社交 媒体 资源 的 利用 者 , 主 
要 指 参与 者 在 社交 媒体 中 进行 知识 的 交流 、 分 享 ,传递 
形成 的 各 种 类 型 的 资源 聚合 形式 。 用 户 画 像 实 现 了 对 
用 户 群 体 的 划分 ,将 相似 的 特征 通过 整合 的 形式 划分 
为 一 类 ,并 将 其 聚集 起 来 ,实现 用 户 的 群体 推送 和 个 性 
化 推送 服务 。 社 交 媒体 中 的 资源 主要 包括 社交 媒体 中 
以 数字 化 形式 呈现 的 各 种 信息 化 的 资源 聚合 ,这 里 不 
仅 包括 我 们 所 熟悉 的 文字 、 图 片 .音频 ,视频 和 广播 ,还 
包括 社交 媒体 中 无 形 资源 ,如 媒体 的 价值 观 和 情感 次 
源 等 。 社 交 媒体 中 的 资源 以 多 样 化 的 形式 存在 ,通过 
资源 画像 将 这 些 资源 整合 ,达到 全 面 记录 所 需 的 知识 
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以 及 为 用 户 表 达 所 需 知 识 资源 的 目的 。 
5.1.2 ”领域 本 体 ”领域 本 体 是 指 概念 与 概念 之 间 的 
映射 关系 ,由 本 体 构 建 者 的 需求 决定 ,可 以 是 一 个 学 科 
领域 或 者 是 某 几 个 领域 的 知识 的 结合 ,也 可 以 是 领域 
中 的 一 个 范围 。 随 着 社交 媒体 领域 资源 的 不 断 聚 合 ， 
组 织 结构 也 发 生 了 显著 的 变化 ,由 原来 的 单一 的 线性 
的 组 织 结构 向 多 维度 ,多 空间 的 网 状 结构 发 展 ,社交 媒 
体 的 资源 聚合 形式 也 客观 地 体现 了 媒体 之 间 资 源 的 关 
联 关系 ,从 现 有 的 研究 领域 可 以 看 出 ,当前 领域 本 体 的 
研究 已 经 不 仅 是 原 有 知识 的 传统 的 属性 结构 ,更 多 的 
是 概念 和 属性 关联 关系 的 多 重 集成 ,从 而 使 领域 本 体 
关注 的 对 象 也 发 生 了 显著 的 变化 ,从 单一 的 主题 向 相 
似 主题 .多 维度 主题 转化 ,语义 的 信息 已 经 向 概念 之 间 
的 映射 与 关联 关系 方面 不 断 拓展 ,多 元 化 信息 资源 之 
间 的 聚合 关系 逐渐 显现 ” 。 
5.2 资源 聚合 模型 

资源 聚合 是 为 了 解决 资源 孤岛 、 信 息 超载 和 宛 余 
等 问题 以 实现 资源 的 快速 获取 。 笔 者 基于 用 户 画 像 的 
研究 概述 ,用户 画像 的 模型 构建 ,以 及 用 户 画像 和 资源 
画像 之 间 的 映射 关系 ,在 对 资源 聚合 的 概念 进行 分 析 
的 基础 上 ,构建 了 资源 画像 的 资源 聚合 模型 ,由 于 资源 
分 布 的 广泛 性 ,以 及 用 户 群体 需求 的 多 样 性 ,因此 在 对 
资源 进行 聚合 时 ,笔者 着 力 打 造 两 种 资源 聚合 模型 ,分 
别 为 基于 社交 媒体 资源 画像 的 内 部 资源 聚合 模型 以 及 
实现 跨 平台 的 基于 不 同 社交 网 络 媒 体 资 源 画 像 的 外 部 
资源 聚合 模型 ,从 而 为 用 户 提 供 精准 的 服务 。 
5.2.1 基于 社交 媒体 资源 画像 的 内 部 资源 聚合 模型 

内 部 聚合 主要 是 针对 社交 媒体 内 部 的 用 户 画 像 、 资 

源 画像 和 本 体 领域 的 聚合 。 通 过 对 繁杂 `. 无 序 资 源 之 
间 的 关系 进行 深度 挖掘 ,建立 特征 之 间 的 联系 ,并 以 用 
户 画 像 为 基础 ,构建 画像 之 间 的 映射 关系 从 而 达到 资 
源 聚 合 的 目的 。 社 交 媒 体 资源 画像 的 内 部 资源 聚合 模 
型 , 见 图 8。 

资源 画像 内 部 资源 聚合 的 模型 主要 分 为 三 个 部 
分 ,分 别 为 资源 层 .算法 层 和 画像 层 。 资 源 层 是 资源 聚 
合 和 服务 的 推送 基础 ,在 数据 库 中 ,主要 包括 豆 办 电影 
用 户 的 数据 和 豆瓣 电影 网 站 资源 的 数据 ,其 中 电影 的 
资源 数据 主要 包括 电影 .图片 .音频 ,视频 和 广播 等 数 
字 资 源 ,用 户 的 数据 主要 包括 用 户 的 基本 信息 ,行为 信 
息 和 需求 信息 等 ,通过 对 数据 信息 的 整理 和 加 工 , 获 取 
所 需要 的 资源 ;算法 层 是 通过 对 豆 办 电影 网 站 用 户 的 
数据 进行 清洗 和 处 理 , 由 于 其 信息 的 概念 粒度 较 细 ,应 
用 机 器 学 习 的 方法 对 用 户 和 资源 的 数据 进行 深层 次 的 
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户 数据 到 | 清洗 加 工 | | 算法 应 ] 标签 化 


着 大 量 的 用 户 群 体 和 海量 的 电影 资源 ,因此 ,通过 分 析 
豆 办 电影 的 资源 信息 以 及 资源 画像 ,可 以 实现 资源 之 
间 的 匹配 和 聚集 ,达到 不 同 资源 网 站 之 间 的 交流 和 合 
作 ,从 而 为 用 户 提供 跨 平 台 的 资源 推送 服务 。 


笔者 基于 用 户 画 像 的 内 涵 、 理 论 和 算法 的 相关 研 
究 , 对 社交 媒体 的 用 户 画 像 进 行 了 深层 次 的 剖析 ,并 以 
豆 因 网 为 例 ,提炼 汲取 了 基于 社交 媒体 用 户 画 像 和 资 


资源 画像 


映射 关系 i 
用 户 画 像 资源 画像 
领域 本 体 


8 ”基于 社交 媒体 资源 画像 的 内 部 资源 聚合 模型 


加 工 ,挖掘 其 本 质 的 内 涵 和 信息 ,对 豆 辩 电 影 中 的 资源 
壕 每 再 组 织 ,从 诸多 的 数据 中 抽取 出 资源 的 标题 ,特征 
和 关键 词 ,对 电影 的 资源 进行 特点 的 分 类 ,从 而 建立 标 
全 请 系 ; 丁 像 层 是 根据 用 户 画像 和 资源 画像 之 间 的 哆 
射 淘 系 ,基于 标签 形 成 三 者 之 间 的 相似 度 矩 阵 ,寻求 本 
体 六 间 的 关联 关系 ,根据 用 户 的 需求 ,为 用 户 提供 精确 
的 匹配 结果 ,通过 资源 画像 实现 资源 聚合 ,为 用 户 提供 
的 推送 信息 ,从 而 实现 良好 的 推送 服务 。 

Nb 基干 社交 媒体 资源 画像 的 外 部 资源 聚合 模型 
负电 影 网 站 的 外 部 ,分 布 着 不 同 的 社交 电影 媒体 的 
平 管 ,它们 之 间 既 存在 竞争 ,同时 也 存在 着 合作 ,因此 ， 
在 器 源 的 联合 方面 ,要 实现 时 平台 信息 资源 的 来 合 ,从 
而 畴 到 为 用 户 提供 更 精准 服务 的 目的 。 基 于 社交 媒体 
资 呈 画 像 的 外 部 资源 聚合 模型 ,如 图 9 所 示 : 
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图 9 基于 社交 媒体 资源 画像 的 外 部 资源 聚合 模型 


通过 图 9 可 以 看 出 ,在 豆瓣 电影 网 站 的 外 部 存在 
着 诸多 电影 类 网 站 ,如 优酷 ,土豆 、 乐 视 、 爱 奇 艺 、 搜 狐 
视频 和 腾讯 视频 等 。 这 些 网 站 与 豆 狼 网 站 一 样 ,存在 
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源 画 像 的 基本 模型 ,并 基于 社会 化 标签 系统 的 基本 方 
法 ,厘清 了 用 户 画 像 . 标 签 和 资源 画像 之 间 的 映射 关 
系 ,构建 了 映射 关系 模型 。 结 合资 源 聚 合 的 内 涵 、 领 域 
本 体 的 相关 知识 ,深入 解析 了 基于 社交 媒体 的 资源 画 
像 资源 聚合 的 影响 因素 ,构建 了 基于 资源 画像 的 社交 
媒体 内 部 资源 聚合 模型 和 外 部 资源 聚合 模型 ,为 具有 
针对 性 的 信息 推送 与 服务 黄 定 基础 。 和 希望 笔者 的 研究 
能 够 为 本 领域 相关 研究 提供 一 定 的 理论 基础 ,进而 丰 
富 和 完善 用 户 画 像 的 相关 研究 。 本 文 的 研究 结论 如 
下 :用 户 画 像 是 真实 反映 用 户 数据 特征 的 虚拟 代表 , 通 
过 对 用 户 数据 的 挖掘 ,分 析出 用 户 的 典型 特征 ,从 而 形 
成 一 个 目标 用 户 的 模型 。 基 于 社交 媒体 的 资源 画像 资 
源 聚 合 模型 主要 分 为 内 部 资源 聚合 模型 和 外 部 资源 聚 
合 模 型 ,通过 两 种 模型 的 运用 ,来 为 用 户 提供 个 性 化 的 
服务 。 
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CS bstract: [ Purpose/significance | This paper creates a social media resource aggregation model based on user por- 
trdfis, provides a reference for resource aggregation, and enriches and expands its theoretical research system. [Method/ 
pss] Based on the in -depth analysis of the connotation and algorithm of user portraits, and mapping relationship be- 
| them ，the models of user portraits and resource portraits are constructed based on social media. The social media - 
based user portraits and resource portraits are studied by using the social labeling system method. Based on the domain on- 
tology method ， through the deep mining of data and the principle of resource aggregation ，a social media internal resource 
aggregation model and an external resource aggregation model based on resource portraits are constructed. [ Result/con- 
clusion | In the era of big data, relevant theories and methods based on user portraits and resource portraits can provide 
new ideas for resource aggregation of social media. 
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